형태소 분석기 [Aiffel] 아이펠 51일차 개념 정리 및 회고 2. 단어를 무작위로 섞어 순서를 무시하지만 단어의 등장 빈도수를 저장 Bag of Words를 하나의 행렬로 구현한 것 = 여러 문서를 이용하며, 각 문서에 등장한 단어의 빈도수를 하나의 행렬로 통합함. 행 = 문서 / 열 = 단어 (반대의 경우는 TDM이라고 칭함.) 저장 공간 낭비(+차원의 저주): 이용하는 문서, 단어의 수가 늘어날 수록 행, 열의 대부분 값이 0을 가지게 됨. 단어 ... 국비교육LSA형태소 분석기파이썬BOWDTMBOW
[Aiffel] 아이펠 51일차 개념 정리 및 회고 2. 단어를 무작위로 섞어 순서를 무시하지만 단어의 등장 빈도수를 저장 Bag of Words를 하나의 행렬로 구현한 것 = 여러 문서를 이용하며, 각 문서에 등장한 단어의 빈도수를 하나의 행렬로 통합함. 행 = 문서 / 열 = 단어 (반대의 경우는 TDM이라고 칭함.) 저장 공간 낭비(+차원의 저주): 이용하는 문서, 단어의 수가 늘어날 수록 행, 열의 대부분 값이 0을 가지게 됨. 단어 ... 국비교육LSA형태소 분석기파이썬BOWDTMBOW